ابوالقاسم مسلمان, طاهره؛ مومنی» عصمت؛ حاجی زین‌العابدینی» محسن (۱۳۹۵). بررسی میزان دقت در 


بازیابی منابع شنیداری با استفاده از الگوریتم کیمینز. پژوهش نامه کتابداری واطلاع‌رسانی» ۶ (۲). 


صه ۳۲۱۰۳۳۷ 


بررسی میزان دقت در بازیابی منابع شنیداری با استفاده از الگوریتم کی -مینز 


طاهره ابوالقاسم مسلمان ه دکتر عصمت مومت + دکتر محسن حاجی زین‌العابدینی" 
تاریخ دریافت: ۹۴/۹/۱ تاریخ پذیرش: ۹۵/۲/۱۵ 


چکیده 
هدف: پژوهش حاضر با هدف تعیین میزان دقت در بازیابی منابع شنیداری با استفاده از روش خوشه‌بندی و ب هکا رگیری 
الگوریت مکی- مینز انجام شده است. 

روش: پژوهش حاضر از نو عم کاربردی و روش پژوهش نیمه‌تجربی و از طریق مشاهده مستقیم است. به‌منظور بررسی میزان 
دفت در بازیابی منابع شنیداری» مجموعه‌ای شامل ۲۳ آلبوم منتشر شده در تابستان سال ۱۳٩۱‏ انتخاب شد. ابتد| پیشینه‌های موجود 
در ه رآلبوم براساس استاندارد فراداده‌ای پی.ب ی .کور فهرست‌نویسی شد. د رگام بعدی هر یک از عناصر فراداده مزیور به‌عنوان 
یک خوشه و توضیحگرها یآن به‌عنوان متغیر در نظ رگرفته شده و الگوریت مکی- مینز در محیط نرم‌افزاری اس. پی. اس. اس بر 
روی داده‌ها اجرا شد و فاصله هر پیشینه تا م رکز حوشه به‌دست آمد. 

یافنه ها با توجه به میزان فاصله هر پیشینه تا م رکز خوشه و ملاک قرار دادن این مقدار به‌عنوان میزان دفت در بازیابی منابع» 
پیشینه‌های یکه بیشترین شباهت به م رکز هر خوشه را دارند د رکمترین فاصله» و پیشینه‌های یک هکمترین شباهت با م رک خوشه را 
دارند در بيشترین فاصله با آن قرا رگرفتند و میزان دقت برای هر خوشه و توضیحگر محاسبه گردید. 


کلید واژه‌ها: دفت, بازیابی منابع شنیداری» خوشه‌بندی» الگوریت مکی- مینز فراداده پی, بی. کور. 


۱ کارشناس ارشد علم اطلاعات و دانش‌شناسی دانشگاه علامه طباطبایی حدم انحججع ۵ حعتعطها. ححصصلهع۵ ۳ 
۲. دکتری علم اطلاعات و دانش‌شناسی» استادیار دانشگاه علامه طباطبایی» 00.60ظ6۵۵]ححوکه.نصعط0 2 


۳. دکتری علم اطلاعات و دانش‌شناسی» استادیار دانشگاه شهید بهشتی ۳0211.00۳ع ۵ تح01ع720 


۲ پژوهش نامه کتابداری و اطلاع رسانی؛ دانشگاه فردوسی مشهد سال ۶ شماره ۰۲ پاییز و زمستان ۱۳۹۵ 


مقدمه و بیان مسئله 

منابع دیداری و شنیداری بخشی از میراث فرهنگی هر کشوری هستند که حجم زیادی از اطلاعاتی 
که به حفظ فرهنگگ یکک جامعه در آینده کمک می‌کند را در خود جای داده‌اند. فراهم آوری منابع 
غیرچاپی و ابزار مرتبط به آنها از اهمیت بسیار زیادی نسبت به منابع چاپی برخوردار است چراکه سطح 
بیشتری از اطلاعات بصری و شفاهی را در خود جای داده و از عناصر ضروری ارتباط محسوب می‌شوند. 
فدراسیون بین‌المللی و انجمن کتابداری در سال ۲۰۰۳ به‌خوبی ارزش منابع دیداری و شنیداری را بیان 
کرده است: «در هیچ توصیفی از منابع دیداری و شتیداری نید آنها را جز منایع تجملی دانست بلکه آنها 
عنصر اصلی و اساسی در ارائه خدمات بکیارچه کتابخانه‌ای هستند» (2014 ,عهع‌سصه ,نا جاهعس). 

یکی از مسائلی که مراکز اطلاع‌رسانی و آرشیوها در حوزه منابع دیداری و شنیداری با آن روبه‌رو 
هستند» روش‌های ذخیره و بازیابی این منابع است. در چهار دهه اخیر پروژه‌های تحفیقاتی قابل‌توجه زیادی 
در حوزه بازیابی منابع شنیداری صورت گرفته است» اما نتایج حاکی از آن است که این حوزه همچنان 
نیازمند مطالعات بیشتری است (2001 ,1370 200 ۵۷10۲۵)). در بازیابی منابع شنیداری با مسائلی روبه‌رو 
هستیم که نشأت گرفته از ماهیت منابع شنیداری است. بنابراین ایجاد نظام‌های بازیابی مناسب با ویژگی‌های 
منحصر به فرد اين منابع و به کار گیری روش‌های مناسب به‌منظور بازیابی منابع شنیداری نقشی به‌سزا در 
استفاده بهینه از این منابع ایفا می کنند. 

برای بهبود نتایج بازیابی راهبردهای متنوعی وجود دارد که یکی از آنها خوشه‌بندی مدارکک 
بازیابی شده است. خوشه‌بندی روشی است که در حوزه‌های گوناگون برای گروه‌بندی ماهیت‌های مشابه 
مورد استفاده قرار می‌گیرد. خوشه‌بندی عبارت است از گروه‌بندی عناصر اطلاعاتی درون دسته‌ها و رده- 
هایی که دارای شباهت ساختاری هستند. در خوشه‌بندی سعی می‌شود تا اطلاعات به خوشه‌هایی تقسیم 
شوند که شباهت بین اطلاعات درون هر خوشه حدا کثر و شباهت بین اطلاعات در بین خوشه‌های متفاوت 
حداقل شود (عامری» ولدان زوج» مختارزاده» ۱۳۸۶). معیار شباهت در روش خوشه‌بندی» فاصله است؛ 
یعنی نمونه‌هایی که به یکدیگر نزدیکتر هستند در یک خوشه قرار می گیرند. لذا محاسبه فاصله بین دو داده 
بسیار مهم است و کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد. بنابراین خوشه‌بندی منابع 
شنیداری به‌صورت خود کار و ترسیم ارزش‌های درونی خوشه‌ها یک مسئله قابل توجه است و می‌تواند 
ارزش‌های بزرگی را به نظام‌های بازیابی اطلاعات موسیقی بیافزاید. بیشتر پژوهش‌های صورت گرفته در 
این زمینه به استخراج محتوا از فایل‌های شنیداری پرداخته است. هدف پژوهش حاضر استفاده از الگوریتم 


کی- مینز (برای خوشه‌بندی پیشینه‌ها) و عناصر فر اداده پی.بی. کور (برای توصیف پیشینه‌ها) به‌منظور 


سال و شماره ۲ پاییز و زمستان ۱۳۹۵ بررسی میزان دفت در بازیابی منابع شنیداری... ۳۳۳ 


بررسی میزان دقت در بازیابی منابع شنیداری است و به اين پرسش پاسخ می‌دهد که میزان دقت الگوریتم 


کی- مینز در بازیابی منابع شنیداری چگونه است؟ 


خوشه‌بندی 

اولین‌بار ایده خوشه‌بندی در دهه ۱۹۳۵ ارائه شد و امروزه با پیشرفت‌ها و جهش‌های عظیمی که در 
آن پدید آمده. خوشه‌بندی مورد توجه بسیاری از محققان قرار گرفته است (طاهریان‌فرد» ۱۳۸۹). لذا در 
کاربردها و جنبه‌های مختلفی حضور يافته و روش‌های مختلفی برای بهره‌برداری از آن مطرح گردیده 
است. هدف خوشه‌بندی» یافتن خوشه‌های مشابه از اشیاء در بین نمونه‌های ورودی است. یکی از مسائل 
مهم در خوشه‌بندی انتخاب تعداد خوشه‌ها است. در بعضی از الگوریتم‌ها تعداد خوشه‌ها از قبل مشخص 
شده است و در بعضی دیگر خود الگوریتم تصمیم می‌گیرد که داده‌ها به چند خوشه تقسیم شوند (قاسمی؛ 
۱۳۸۸ 

سنجش فاصله یا سنجش شباهت میان دو واحد در حکم قلب تینده خوشه‌بندی اسناد است. چند 
روش برای اندازه گیری شباهت میان دو پیشینه وجود دارد؛ بعضی مبتنی بر مدل‌برداری هستند (مانند فاصله 
کسینوسی يا فاصله اقلیدسی) و الگو دیگر مبتتی بر مدل بولی مانند اندازه فصول مشترک میان مجموع 
اصطلاحات سند است (1999 ,۲۶۵/۱2840 20 0127916600)). به‌طور کلی سه روش عمده سلسله مراتبی» 
روش تقسیمی و روش هم‌پوشانی برای اجرای فرآیند خوشه‌بندی وجود دارد. 

الگوریتم‌های زیادی برای خوشه‌بندی به روش‌های گوناگون وجود دارد. یکی از روش‌های 
مناسب. کار آمد و ساده. خوشه‌بندی با استفاده از الگوریتم کی- مینز است. خوشه‌بندی به‌روش کی- مینز 
یکی از متداول‌ترین روش‌های خوشه‌بندی دارای فر آیند تکرار و از نوع روش تقسیمی است. این الگوریتم 
در مواردی دارای کاربرد است که در آن هر عارضه تنها به یک کلاس تعلق می‌گیرد. این الگوریتم یکك 
الگوریتم نظارت نشده و دارای تکرار است که در آن مجموعه داده به »1 خوشه تقسیم‌بندی شده و نقاط 
داده به‌طور تصادفی به این خوشه‌ها تعلق می گیرند. سپس برای هر نقطه. فاصله آن نقطه تا مرکز خوشه 
محاسبه گردیده و نقطه موردنظر به نزدیکترین خوشه تعلق می گیرد. این مراحل تا جایی تکرار می‌شود که 
دیگر هیچ نقطه‌ای تغییر مکان پیدا نکند. ویژگی‌های اين الگوریتم عبارتند از: همواره ۲ خوشه وجود دارده 
همواره حداقل یک نقطه در هر خوشه است» خوشه‌ها به‌صورت سلسله مراتبی نبوده و با یکدیگر هم- 
پوشانی نیز ندارند. هر عضو یکك خوشه. نسبت به خوشه‌های دیگر دارای کمترین فاصله از مرکز خوشه 


خود است (عامری و دیگران» ۱۳۸۶). لازم به ذ کر است که متفاوت بودن تعداد خوشه‌های اولیه موجب 


۴ پژوهش نامه کتابداری و اطلاع رسانی؛ دانشگاه فردوسی مشهد سال ۶ شماره ۰۲ پاییز و زمستان ۱۳۹۵ 


متفاوت بودن خوشه‌های نهایی می‌شود. بنابراین بهتر است الگوریتم را برای مقادیر مختلف 11 اجرا نموده و 
نتایج را با یکدیگر مقایسه نمود (بخشی و فیضی در خشی. ۱۳۸۹). 

۳ الگوریتم کی- مینز خوشه‌ها حاوی اسنادی‌اند که با یکدیگر مشابهت و ارتباط زیادی دارند. 
به‌نقل از پترسون" کی- مینز یک اصطلاح پیشنهادی توسط مک کوئین" است که در سال ۱۹۰۰ برای 
توصیف الگوریتم خوشه‌بندی‌اش ارائه شد. به‌منظور درک واریانس (پراکنش) آماری جمع مجذورات بین 
گروه» کی - مینز از مجذور فاصله اقلیدسی استفاده می کند. فاصله اقلیدسی بین دو نقطه» کوتاه‌ترین فاصله 
بین این دو نقطه در فضای اقلیدسی است. تابع فاصله اقلیدسی جذر مربعی مجموع مربعات تفاوت‌های بین 
مقادیر متناظر را محاسبه می‌نماید. این تابع فاصله بین نقطه و لا را توسط فرمول زیر محاسبه می کند: 


0 1 


مربع فاصله اقلیدسی همیشه بزرگتر یا مساوی صفر است. عدد صفر نشانگر نقاط یکسان و اعداد 
بالاتر نشانگر نقاطی هستند که شباهت کمتری دارند. 

جانسون و ویچرن " (۲۰۰۷) فرآیند خوشه‌بندی با استفاده از الگوریتم کی- مینز را گامبه گام معرفی 
کرده‌اند که عبارت از تقسیم‌بندی نقاط داده‌ها به کا (16) خوشه درونی به‌طور قراردادی» محاسبه مرکز هر 
خوشه. انتخاب یک نقطه داده به‌طور تصادفی برای شروع» حرکت در میان فهرست موارد يا نقاط؛ 
تخصیص یک مورد به خوشه‌ای که نزدیک ترین فاصله را به مرکز خوشه دارد و استفاده از فاصله اقلیدسی» 
محاسبه مجدد م رکز برای خوشه دریافتی با نقاط جدید و برای نقاط گمشده خوشه و در نهایت تکرار گام - 


های ۳ ۴ و ۵ است تا اینکه تخصیص داده‌ها دوباره رخ دهد (2009 ,۳6/6750۳). 


فراداده بی.بی. کور 

عوامل گوناگونی در خوشه‌بندی مدارک موثر است که یکی از آنها نوع خصیصه‌ای است که به- 
واسطه آن یک مدرک مورد بازنمایی قرار می گیرد. نوع خصیصه در کنار الگوریتم مناسب برای خوشه- 
بندی از اهمیت سیار بالابی در خوشه‌بندی منابع برخوردار است (کرمانی حبیبآبادی» ۱۳۹۰). بنابراین 


انتخاب درست خصیصه برای مدارکک در نتایج خوشه‌بندی تأثیر گذار خواهد بود. غالبا به کار گیری ت رکیبی 


0 .1 
1۷]260۵6۵ .2 
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سال و شماره ۲ پاییز و زمستان ۱۳۹۵ بررسی میزان دفت در بازیابی منابع شنیداری... ۳۳۵ 


از ساختار تشکیل‌دهنده منابع» می‌تواند به‌عنوان خصیصه‌ای مناسب برای بازیابی منابع مورد استفاده قرار 

گیرد. به‌منظور توصیف ساختار تشکیل‌دهنده منابع می‌توان از استانداردهای فراداده‌ای استفاده کرد. منابع 

دبداری و شنیداری استانداردهای فراداده‌ای مختص به خود را دارند» یکین از استانداردهای فراداده‌ای منابع 

دیداری و شنیداری استاندارد فراداده‌ای پی.بی. کور است. 

هسته پی.بی. کور یک منبع فراداده‌ای و فهرستنویسی برای مراکز رسانه‌ای و مراکز مشابه است. این 
استاندارد به‌وسیله مجامع عمومی رسانه‌ای در آمریکا و به‌منظور استفاده این مراکز توسعه یافته است. این 
استاندارد؛ بر پایه فراداده‌های هسته دوبلین شکل گرفته و به‌وسیله کارشناسان طرح فراداده‌ای هسته دوبلین 
نیز مورد بررسی قرار گرفته است. هسته پی.بی. کور در واقع راهی استاندارد برای توصیف و استفاده از 

رسانه‌هاست و کمک می کند که محتوای آنها به‌سهولت بازیابی شود (قدیمی» ۱۳۸۷). با رجوع به عناصر و 

توضیحگرهای فراداده دابلین کور» این مجموعه فراداده دیداری شنیداری روی هم رفته ۴ عنصر و ۵۲ 

بو تیه کر را نشان می‌دهد. این عناصر براساس معیارها و استانداردهای عناصر داده‌ای 11179 ۲50.۲۳0 

در ٩‏ ویژگی مشخص شده‌اند؛ این ویژ گی‌ها عبارتند از: نام شناسه؛ نسخه زبان, تعریف الزام» نوع داده؛ 

بیشترین رخداد و توضیح. استاندارد 11179 150.1۳0 جنبه‌های اصلی عناصر داده‌ای را تعیین می کند که 

شامل فراداده نیز است. این استاندارد برای بازنمون تدوین عناصر داده‌ای و معناسازی مانند آنچه میان انسان 

و ماشین رخ می‌دهد» کاربرد دارد (9.0 ,150 101670010021 هر یک از این عناصر خود شامل یک‌سری 

توضیحگر می‌باشند که عبارتند از: 

*_ توضیحگرهای عنصر محتوای فکری شامل شناسه هسته پی.بی. کور» شناسه منبع» عنوان» نوع عنوان؛ 
موضوع. موضوع استفاده شده. توصیف. نوع توصیف. نوع. نوع استفاده شده نوع ارتباط شناسه 
ارتباط پوشش. نوع پوشش سطح مخاطب. میزان مخاطب. 

* توضیحگرهای عنصر مالکیت فکری شامل پدید آورنده» نقش پدید آورنده توزیع کننده نقش توزیع - 
کننده ناشر» نقش ناشر» خلاصه حقوق. 

٩‏ توضیحگرهای عنصر نمونه شامل اطلاعات تولید. اطلاعات انتشار» قالب فیزیکی قالب دیجیتال» محل 
نگهداری» نوع رسانه. قالب تولیده قالب استاندارد» رم زگذاری قالب اندازه فایل زمان شروع» مدت 
زمان» میزان اطلاعات» عمق بیت» میزان نمونه‌برداری» اندازه قالب» جنبه نسبی» میزان قالب» رنگ» 
ترکک» قالب پیکربندی شبکه زبان حالت‌های جایگزین» اطلاعات اولین دسترسی» اطلاعات آخرین 


دسترسی» شناسه قالب. شناسه منبع» حاشیه‌نویسی. 
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۰ جح ی و ۴ 3 ی م ‏ ح ام ِ 
۰ توضیحگر عنصر گسترش شامل گسترش و گسترش استفاده شده. 


خوشه‌بندی منابع در گذر زمان 

حسینی (۱۳۹۰) در مقاله خود با عنوان «بررسی عناصر و مولفه‌های رابط کاربر در نظام‌های بازیایی 
اطلاعات مبتنی بر خوشه‌بندی» به‌بررسی موتورهای خوشه‌بندی» برای کمک به بازیاپی اطلاعات مرتبط 
موجود در وب. در سطح وسیعی پرداخته است. هدف این مقاله. شناسایی عناصر و مژلفه‌های مهم رابط 
کاربر نظام‌های خوشه‌بندی و تعیین میزان استفاده از عناصر و ملفه‌های شناسایی شده در موتورهای 
خوشه‌بندی مورد مطالعه است. کرمانی حبیب آبادی (۱۳۹۰) در رساله خود با عنوان «ارزیابی تأثیر استفاده 
از وازگان عناوین استنادی در مقایسه با استفاده از اشتراک استنادی در خوشه‌بندی پروانه‌های ثبت اختراع» 
به ارزیابی و مقایسه خصیصه استناد در قالب اشتراک در مآخذ و خصیصه واژگان عناوین استنادها در 
خوشه‌بندی پروانه‌های ثبت اختراع پرداخته است. وی با استفاده از روش تجربی بر روی مجموعه‌ای شامل 
پروانه‌های ثبت اختراع یو. اس. مربوط به رده ۹۷۷/۷۷۴ از رده‌بندی یو.اس. پرداخته است. یافته‌ها نشان 
داده است که خوشه‌بندی پروانه‌های ثبت اختراع با استفاده از اشتراک در ما خذ عملکرد بهتری را نست به 
خوشه‌بندی با استفاده از وازگان عناوین استنادها دارد و ساختار خوشه‌ای در سطوح کته ده تزع از 
جامعیت در خوشه‌بندی با اشتراک در ماخذ برقرار است. فیلی و گراکی" (۲۰۰۸) در پایان‌نامه خود با عنوان 
«خوشه‌بندی سریع به‌منظور بازیابی اطلاعات وب» بر روی خوشه‌بندی خلاصه‌سازی و تشابهات جستجوی 
ویدئو تمرکز دارد. در مورد اطلاعات کوچک و بزرگک وب. از خوشه‌بندی برای سازماندهی نتایج به- 
دست آمده به‌وسیله یکک یا بیش از یک موتور جستجو در پاسخ به پرسش کاربر در یک سطح استفاده شد. 
در اين پژوهش پژوهشگر یک روش خوشه‌بندی تفریبی» بسیار سریع‌تر از الگوریتم‌های هنر بیان کرد. در 
اين اثر خوشه‌بندی به‌صورت آفلاین و بر روی عبارات پردازش نشده و براساس جستجوهای مشابه به کار 
برده شده است. در پایان یک راهبرد خوشه‌بندی جدید به‌منظور بهبود کیفیت نتایج و وزن‌دهی برنامه‌هایی 
که برای پیش پردازش مفید نیستند ارائه شد. پاناگاکسی " (۲۰۰۸) در مقاله خود با عنوان «طبقه‌بندی انواع 
موسیقی رویکردی چندخطی» از مدل چند مقیاسی طیف‌نگار زمانی به‌وسیله اعتبار بیرونی مدل فر آیندی 


استفاده کرد. لثو و دیگران" (۲۰۰۹) در مقاله خود با عنوان «تحقیق بر روی نظام بازیایی اطلاعات مبتنی بر 
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الگوریتم خوشه‌بندی آنت » معتقد است که استفاده از اینترنت روز به روز گسترده‌تر می‌شود و منابع 
اطلاعاتی با ارزشی برای کاربران فراهم می‌نماید. با وارد نمودن خوشه‌بندی مبتنی بر آنت و ذخیره آن 
بازیابی اطلاعات و نتایج خوشه‌بندی دقیق‌تر و سریع‌تر می‌شود. در نتیجه استفاده از الگوریتم خوشه‌بندی 
آنت سرعت و کیفیت بازیابی اطلاعات را افزايش می‌دهد. توراه لانائو و میاموتو" (۲۰۱۰) در مقاله خود با 
عنوان «خوشه‌بندی فازی برای نمایه‌سازی در نظام بازیایی اطلاعات کامبال ) معتقد است که گامبال نظام 
بازیابی اطلاعات برای نمایه‌سازی و دستیابی به صفحات وب است که شامل رابط گرافیکی برای جست- 
وجو و دستیابی آسان به صفحات وب است. در این پژوهش رابط‌ها توسط کاربران با ابزاری برای ناوبری 
فو فان اشاد یله مراک و انتاه اای شله موی سا وه نها در امن کي از ری 
فازی و شخوشه‌بندی سلسله مراتبی برای نمایه‌سازی رابط‌های گرافیکی استفاده شده است. شیندلر " (۲۰۱۱) 
در پایان‌نامه خود با عنوان «خوشه‌بندی برای تحلیل و بازیابی: الگوریتم‌ها و کاربردها» می‌نویسد خوشه- 
بندی» یکی از بهترین روش‌ها برای حل مشکلات بازیابی اطلاعات است. در اين پژوهش محیطی طراحی 
شده است تا عملکرد الگوریتم قبل و بعد از تعیین اشیا برای بهینه ساختن مشخص شود. در اين پژوهش 
کاربرد خوشه‌بندی با آدرس‌دهی اطلاعات کسب شده به‌جای مبادله با یک بار اضافه از همان اطلاعات 
مورد بررسی قرار گرفته است. در اين اثر از الگوریتم کی- مینز برای آدرس‌دهی و پالایش با تشریکک 
مساعی استفاده شده است. 
تیزانتا کسی" و ک وک (۲۰۱۲) در پژوهش خود با عنوان «طبقه‌بندی نوع موسیقیایی سیگنال‌های 
صوتی» از ساختار طنینی؛ محتوا آهنگین و تراکم کارکترها به‌عنوان ویژگی برای محاسبه آماری الگوی 
شناختی طبقه‌بندی با شصت و یک درصد دقت استفاده کرد. دیکر و گر" (۲۰۱۲) در پژوهش شود با عنوان 
عنوان «آیا شعر ترانه می‌تواند نوع موسیقی را تعیین کند؟» سعی کرد ترانه‌ها را براساس شعرهای استفاده 
شده و طبقه‌بندی ناوه سازماندهی کند اما نتایج نشان داد تحلیل شعر به‌تنهایی کافی نیست. سن " (۲۰۱۴) در 
در پژوهشی با عنوان «خوشه‌بندی خودکار موسیقی براساس نوع موسیقی» ترانه‌های موجود را در چند 
گروه کلاسیک. متال. رپ و موسیقی بی کلام تقسیم کرده و با استفاده از الگوریتم کی- مینز میزان دقت 
در بازیابی نتایج را محاسبه می‌کند که اين میزان برای هزار و ششصد پیشینه در چهار خوشه برابر با هشتاد و 
اصض. 
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هفت درصد بود. 


روش پژوهش 

پژوهش حاضر از نوع کاربردی و روش آن نیمه تجربی است و به‌دنبال آن بود تا با اعمال الگوریتم 
کی- مینز بر روی پایگاه داده ایجاد شده توسط پژوهشگر تغیبرات حاصل از به کارگیری اين الگوریتم و 
استفاده از روش خوشه‌بندی در بازیابی اطلاعات را نشان دهد. 

جامعه پژوهش از میان آلبوم‌های منتشر شده در تابستان سال هزار و سیصد و نود و یک برگزیده 
شد. این آ ار عبارتند از: «ترس من و بارون بی‌نشان» می‌تراود مهتاب. جادوی سکوت. حالیا. داستان‌های 
منظوم» شیرین‌تر از شیرین» گاهی سه گاهی. سیبی از بوستان دوست. دی رگاهی است» رخحصت. سایه‌وار» 
سایه روشن آژنگ. از من تنها تو مانده‌ای» حریق خزان مهربونم» نافه‌های بهاری. سحر ساز, نای جان آن 
عاشقی و آرزوی دل». 

به‌منظور گرد آوری داده‌ها به آرشیو موسسه فرهنگی و هنری سروش مراجعه شد و فهرستی از 
آثاری که در سال هزار و سیصد و نود و یکک به انتشار رسیده بوده تهیه گردید. سپس با روش مشاهده 
مستقیم تمامی آلبوم‌های منتشر شده مورد بررسی و تحلیل قرار گرفت و سپس از نرم‌افزار اکسل" به‌منظور 
تهیه پایگاه اطلاعاتی توصیفی و نرم‌افزار اس.پی.اس.اس" به‌منظور ایجاد پایگاه اطلاعاتی داده‌های کمی و 
همچنین محیطی برای اجرای الگوریتم کی- مینز استفاده شد. 

به‌منظور تجزیه‌وتحلیل داده‌ها؛ ابتدا اطلاعات اولیه که بر مبنای عناصر و توضیحگرهای فراداده 
پی.بی. کور است را از پیشینه‌های شنیداری که شامل دویست و هفتاد قطعه موسیقی با کلام و بی کلام است 
استخراج شد. سپس اطلاعات به‌دست آمده در پایگاه اطلاعاتی اکسل وارد شده و محیط نرم‌افزار 
اس.پی.اس.اس برای پیداسازی الگوریتم کیمینز برگزیده شد. به‌همین منظور ابتدا اطلاعات به‌دست 
آمده که در پایگاه اکسل وارد شده و به‌صورت مقیاس کیفی است به داده‌هایی با مقیاس کمی تبدیل 
گشت و این امر با اختصاص برچسب‌های عددی به هر یکک از متغیرهای پژوهش که همان توضیحگرهای 
عنصر فراداده‌ای پی.بی. کور هستند صورت گرفت. تعداد پیشینه‌های موجود دویست و هفتاد و یک قطعه 
است که با اختصاص برچسب و با در نظر گرفتن تکراری بودن بعضی از عناوین به دویست و بیست 
برچسب رسید. نام آلبوم‌ها؛ سبکک موسیقی نام کشور نام خواننده» نام نوازنده» نام ناشر جز متغیرهایی 
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هستند که مانند متغیر عنوان با اختصاص برچسب تبدیل شدند. برای اجرای الگوریتم مزبور در محیط نرم- 
افزاری اس.پی.اس.اس به قسمت آنالیز" رفته و گزینه ۷نععه01) انتخاب شد. در این قسمت یک فهرست 
کشویی ارائه می‌شود که برای اجرای الگوریتم کی- مینز باید 1 عذورلمصه تعافتااه فصمع > انتخات 
شود. بعد از طی نمودن مراحل ذکر شده کادر محاوره‌ای باز می‌شود که در این کادر متغیرها و تعداد 
خوشه‌ها مشخص می‌شود. تعداد خوشه‌ها در این پژوهش براساس عناصر فراداده پی.بی. کور انتخاب شد 
که عبارت از توضیحگر عنوان برای عنصر محتوای فکری» توضیحگر پدید آور که اینجا خواننده هر قطعه 
در نظر گرفته شده است. برای عنصر مالکیت فکری؛ توضیحگر زمان برای عنصر نمونه و توضیحگر نوع 
اجرای قطعات برای عنصر گسترش است. 
تصویر ۱. کادر محاوره‌ای کاوزاقصه عهاعل 205ع0->1 در نرمافزار 5۳55 
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اریعاعای (اعععقع) [+ععقهی | رعاعععا [سکافا 
پس از مشخص شدن تعداد خوشه‌ها و ورود متغیرها به کادر محاوره‌ای بالاء جدول‌هایی ارائه می- 
شود که نشان‌دهنده مرکز هر خوشه. فاصله هر رکورد تا مرکز خوشه تعداد تکرارهایی که به‌صورت 
خود کار توسط نرم‌افزار صورت گرفته. فاصله مرکز هر خوشه تا مرکز خوشه‌های دیگر و جدول توزیع 
فراوانی و واریانس هر خوشه است. در پایان به‌منظور تعیین میزان دقت در بازیایی نتایج» پژوهشگر از 
فرمول ارائه شده در پژوهش سن (۲۰۱۴) بهره گرفت. 


یافته‌ها 


0 


جدول ۱ به بررسی مراکز خوشه‌ها» فاصله هر پیشینه تا مرکز خوشه و پیشینه‌هایی که بیشترین و 
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جدول ۱. میزان دقت الگوریتم کی - مینز در بازیایی توضیحگر عنصر محتوای فکری 


خوشه‌ها مر کز خوشه | فاصله هر پیشینه تا مر کز خوشه بیشترین فاصله کمترین فاصله 
خدا را تو مرو 
خوشه اول سایه و سرو ۵۱۳۳۸ ارغوان (۲۹/۷۷۲) 
(۲۲۸/ 
خوشه دوم لیلی و مجنون ۱ اخم تو (۲۶/۸۶۴) بختیاری (۰/۱۳۶) 
خوشه سوم مرد و کلاغ‌ها ۱۱۸۴۱ دلی در آتش (۲۹/۱۴) | چه سخته (۰/۱۴۱) 
خوشه چهارم بتیمکک ۱۳/۱۳۶ آرزو (۳۱/۷۹۷) کاروان (۰/۲۰۳) 


جدول ۱ نشان می‌دهد که مراکز خوشه‌های اول تا چهارم که به‌صورت خود کار و توسط نرم‌افزار 
مزبور انتخاب شده است» در عنصر محتوای فکری در صورتی که توضیحگر عنوان؛ به‌عنوان متغیر در نظر 
گرفته شده باشد عبارت از سایه و سرو برای خوشه اول لیلی و مجنون برای خوشه دوم مرد و کلاغ‌ها 
برای خوشه سوم و بتیمک برای خوشه چهارم است. بیشترین فاصله تا پيشینه سایه و سرو را پیشینه ارغوان و 
کمترین فاصله تا این پیشینه را پیشینه خدا را تو مرو دارد. بیشترین فاصله تا پیشینه لیلی و مجنون را پیشینه 
اخم تو و کمترین فاصله تا اين پیشینه را پیشینه بختیاری دارد. بیشترین فاصله تا پیشینه مرد و کلاغخ‌ها را 
پیشینه دلی در آتش و کمترین فاصله تا اين پیشینه را پیشینه چه سخته دارد. بیشترین فاصله تا پیشینه یتیمکک 
را پیشینه آرزو و کمترین فاصله تا این پیشینه را پیشینه کاروان دارد. 

با بررسی نتایج به‌دست آمده از روش خوشه‌بندی و تعیین مراکز خوشه و فاصله نزدیکترین و 
دورترین رکورد با اطلاعات توصیفی هر یکک از پیشینه‌ها می‌توان گفت در خوشه اول با مرکزیت سایه و 
سری نزدیکترین رکورد به اين مرکز قطعه «خدا را تو مرو» است که دارای آلبوم. خواننده» نوازنده» مدت 
زمان» تولید کننده و نوع اجرای یکسانی با قطعه سایه و سرو است. در خوشه دوم با مرکزیت لیلی و مجنون 
قطعه بختیاری کمترین فاصله را با این رکورد دارد و هر دوی آنها دارای ویژگی‌های مشت رک در نوع 
اجرای قطعات و مدت زمان هستند. در خوشه سوم با مرکزیت مرد و کلاغ‌ها نزدیکترین رکورد به این 
مرکز رکورد چه سخته است و این دو رکورد دارای مدت زمان یکسان, تولید کننده و نوع اجرای مشترک 
هستند. در خوشه چهارم با مرکزیت پیشینه بتیمک, قطعه کاروان کمترین فاصله را با این مرکز دارد. این 
دو رکورد در نام آلبوم» خواننده و مدت زمان با یکدیگر یکسان هستند. 


سال ۶ شماره 3 پاییز و زمستان ۱۳۹۵ 


جدول ۲. میزان دقت الگوریتم کی - مینز در بازیابی توضیحکر عنصر مالکیت فکری 


خوشه‌ها 
خوشه اول 


خوشه دوم 


خوشه سوم 


خوشه چهارم 


مرکز خوشه 
علی انصاری 


محمد معتمدی 


بی کلام 


بابک جهانبخش 


فاصله هر پیشینه تا مر کز خوشه 


۳.۲۳ 


۳ 


بیشتر بن فاصله 
تیتراز شروع 
(۴/۳۰۳) 


آن عاشقی (۱/۰۹۳) 


مهربونم (۲/۵۹۵) 


داستان‌های منظوم 
(۴/۲۱۳) 


کمتر بن فاصله 
بی‌نشان (۰/۳۲۰۳ 


آرزوی دل (۰/۰۹۳) 


نافه بهاری» سحر 
ساز و نای جان 
(۰/۴۰۵) 


من و بارون (۰/۲۱۳) 


همان‌طور که در جدول دو مشاهده شدء مراکز خوشه‌های اول تا چهارم در عنصر مالکیت فکری 
در صورتی که توضیحگر پدیدآور به‌عنوان متغیر در نظر گرفته شده است عبارت از علی انصاری خواننده 


آلبوم بی‌نشان برای خوشه اول» محمد معتمدی خواننده آلبوم گاهی سه گاهی برای خوشه دوع قطعات 


بی کلام برای آلبوم‌های که خواننده ندارند و بی کلام هستند به‌عنوان مرکز خوشه سوم و بابک جهانبخش 


خواننده آلبوم من و بارون به‌عنوان مرکز خوشه چهارم است. بیشترین فاصله تا آلبوم بی‌نشان (از نظر 
پدید آور) را آلبوم داستان‌های منظوم دارد. بیشترین فاصله تا آلبوم گاهی سه‌ گاهی را آلبوم آن عاشقی و 
کمترین فاصله را آلبوم آرزوی دل دارد. بیشترین فاصله تا مرکز خوشه سوم متعلق به آلبوم مهربونم و 
کمترین فاصله متعلق به آلبوم‌های نافه بهاری» سحر ساز و نای جان است. بیشترین فاصله تا آلبوم من و 
بارون نیز از آن آلبوم داستان‌های منظوم است. 


با پررسی اطلاعات توصیفی این آلبوم‌ها می‌توان نتیجه گرفت که دورترین آلبوم‌ها با مرکز هر 


خوشه از نظر زمان نوازنده شاعره تولید کننده و نوع اجرای قطعات بیشترین تفاوت را با هم داشته‌اند. 


خوشه‌ها 


خوشه اول 


خوشه دوم 


خوشه سوم 


خوشه چهارم 


مر کز خوشه 


۳۳ 


فاصله هر پیشینه تا مر کز خوشه 


22 


۰/۳۹۲ 


بیشتر بن فاصله 
بیداد کت (۱/۸۷۳) 
آواز بیات ترکث 


)۴/۵۹۶( 


علی مولا (۲/۱۸۸) 


جدول ۳. میزان دقت الگوریتم کی - مینز در بازیایی توضیحگر عنصر نمونه 


کمترین فاصله 
چهار مضراب نوا 
(۰/۰۰۳) 
ساز و آواز افشاری 
(۰/۰۴۶) 


جان جانان (۰/۱۲۸) 


۲ پژوهش نامه کتابداری و اطلاع رسانی؛ دانشگاه فردوسی مشهد سال ۶ شماره ۰۲ پاییز و زمستان ۱۳۹۵ 


با توجه به جدول سه مراکز خوشه‌های اول تا چهارم در عنصر نمونه در صورتی که مدت زمان 
پیشینه به‌عنوان متغیر در نظر گرفته شده است عبارت از دو دقیقه و سیزده ثانیه برای خوشه اول نه دقیقه و 
پنجاه و هشت ثانیه برای خوشه دوم بیست دقیقه و پنجاه و پنج ثانیه برای خوشه سوم و چهار دقیقه و پنجاه 
و نه انیه برای خوشه چهارم است. بیشترین فاصله تا مرکز خوشه اول متعلق به پیشینه بیداد کت و کمترین 
فاصله متعلق به پیشینه چهار مضراب نوا است. بیشترین فاصله تا مرکز خوشه دوم متعلق به پیشینه آواز بیات 
ترکک و کمترین فاصله متعلق به پیشینه‌ساز و آواز افشاری است. بیشترین فاصله و کمترین فاصله تا مرکز 
خوشه سوم متعلق به پیشینه‌هایی است که نامی ندارد (نامشخص) البته در این پژوهش تنها یک پیشینه وجود 
دارد که با توجه به‌مدت زمانش مرکز خوشه قرار گرفته است و پیشینه‌ای دیگر با این مدت زمان وجود 
ندارد تا فاصله‌ای با مرکز خوشه داشته باشد. بیشترین فاصله تا مرکز خوشه چهارم متعلق به پيشینه علی‌مولا 
و کمترین فاصله متعلق به پیشینه جان جانان است. 

با بررسی نتایج به‌دست آمده از پایگاه اطلاعات توصیفی مشخص شد در صورتی که مدت زمان 
به‌عنوان توضیحگر تعیین شود. مرکز خوشه دقیقاًبیانگر مدت زمان رکوردی است که کمترین فاصله را 
مرکز خوشه دارد و بیشترین فاصله متعلق به رکوردی است که بیشترین اختلاف را از نظر مدت زمان با 
خوشه دارد. برای مثال در خوشه اول نزدیکترین فاصله را رکورد بیداد کت با مدت زمان ۲:۱۳ انیه و 
دورترین فاصله را رکورد چهار مضراب نوا با زمان ۱۰:۸ ثانیه دارد. در خوشه دوم نزدیکترین رکورد «ساز 
و آواز افشاری» است که دقیقاً ۹:۵۸ ثانیه است و بیشترین فاصله متعلق به آواز بیات ت رک است که مدت 
زمان آن ۱۴:۱۳ است. در خوشه سوم همنوازان به‌عنوان مر کز خوشه قرار گرفته است که مدت زمان آن 
۵ ثانیه است و از آنجایی که هیچ رکوردی چنین مدت زمان ندارد» رکورد همنوازان تنها عضو و مرکز 
خوشه سوم قرار گرفته است. در خوشه چهارم رکورد راز مبهم با ۴:۵۹ ثانیه به‌عنوان مرکز خوشه و جان 
جانان با مدت زمان ۵:۱ نزدیکترین رکورد به مرکز و رکورد علی مولا با مدت زمان ۷:۷ ثانیه دورترین 
پیشینه تا مرکز قرار گرفت. 

جدول ۴. میزان دقت الگوریتم کی - مینز در بازیایی توضیحگر عنصر گسترش 


خوشه‌ها مر کز خوشه فاصله هر پیشینه تا مر کز خوشه بیشتر بن فاصله کمتر بن فاصله 
خوشه اول الکترونیک ۹۶« ۰:۹۶ ۰,۳۴ 
خوشه دوم سینتی‌سایزر 
خوشه سوم همنوازی ۰,۳۱ ۱/۵۶۹ ۰,۳۱ 
خوشه چهارم تکنوازی ۰-۸۳۱ ۰۶۹ ۰-۳۱ 


سال و شماره ۲ پاییز و زمستان ۱۳۹۵ بررسی میزان دفت در بازیابی منابع شنیداری... ۳۳۳ 


جدول چهار نشانگر مراکز خوشه‌های اول تا چهارم در عنصر گسترش در صورتی که نوع اجرای 
قطعات به‌عنوان متغیر در نظر گرفته شده است عبارت از الکترونیکک برای خوشه اول» سینتی‌سایزر برای 
خوشه دوم» همنوازی برای خوشه سوم و تکنوازی برای خوشه چهارم است. در اين بخش تنها به آوردن 
میانگین فاصله رکوردها و میزان بیشترین و کمترین فاصله تا مراکز خوشه در جدول اکتفا شده و به‌دلیل 
فراوانی تعداد پیشینه‌ها از آوردن نام تک تک پیشینه‌ها خودداری شد. 
در گام بعدی تحلیل یافته‌ها میزان دقت نتایج بازیابی شده توسط روش خوشه‌بندی با الگوریتم 
کی- مینز با هدف اثبات میزان دقت این روش و همچنین تکمیل اطلاعات توصیفی به‌دست آمده از پایگاه 
اطلاعات توصیفی دقت هر یک از عناصر فراداده پی.بی. کور با استفاده از فرمول ذیل محاسبه شد ( ,560 
214 
۲ تعداد پیشینه‌های مرتبط موجود در هر خوشه 
> + .جح 
تعداد پیشینه‌های موجود در هر خوشه 
در این پژوهش تعداد پیشینه موجود در هر خوشه به‌صورت خود کار توسط نرم‌افزار محاسبه شد و 
به‌منظور به‌دست آوردن صورت کسر تعداد کل پیشینه‌ها را که برابر دویست و هفتاد و یک پیشینه بود 
مورد بررسی قرار گرفت و با کمک پایگاه داده‌های توصیفی ایجاد شده در نرم‌افزار اکسل " تعداد پیشینه- 
های مرتبط در هر خوشه محاسبه شد. جدول ۵ بیانگر دقت در هر خوشه از عنصر محتوای فکری است. 
جدول ۵. میزان دقت در بازیایی عنصر محتوای فکری 


رکوردهای موجود رکوردهای مر تبط ۲ 
خوشه‌ها | مرکز هر خوشه 1 ار دقت 
در هر حوسه در هر حوسه 
۱ سایه و سرو ۷۷ ۱ ۱/۳۹ 
۳ مرد و کلاغخ‌ها 2۹ ۱ ۱/۶۹ 
۴ یتیمکک ۶۷ ۵ ۷/۴۶ 
کل دقت ۱/۹۷ 


با توجه به جدول ۵ میزان دقت در بازیایی عنصر محتوای فکری برای خوشه اول ۰۱/۲۹ برای 
خوشه دوم ۰۱/۴۷ برای خوشه سوم ۹ و برای خوشه چهارم ۷/۴۶ است. جمع کل میزان دقت در عنصر 


محتوای فکری برابر با ۲/۹۷ است. 


1. ۳۶۵ 


۴ پژوهش‌نامه کتابداری و اطلاع رسانی» دانشگاه فردوسی مشهد 


سال ۶ شماره ۲ پاییز و زمستان ۱۳۹۵ 


جدول ۶. میزان دقت در بازیابی عنصر مالکیت فکری 


رکوردهای موجود رکوردهای مر تبط 
خوشه‌ها | مرکز هر خوشه کل ر کو ع نی و دقت 
در هر خوشه در هر خوشه 
۱ علی انصاری ۷۶ ۹ ۱/۸۴ 
۲ محمد معتمدی ۲۲ ۸ ۳,۹۳۶ 
۳ بی کلام ۱۳۶ ۱۳۱ ٩,۳‏ 
۴ بابک جهانبخش ۳۷ ۱ ۳۳/۴۰ 
کل دقت ۳۹/۴۰ 


و برای خوشه چهارم با مرکزیت بابک جهانبخش ۲۳/۴۰ است. جمع کل میزان دقت در عنصر مالکیت 


فکری برابر با ۳۹/۴۰ است. 


جدول ۷. میزان دقت در بازیابیی عنصر نمونه 


رکوردهای موجود ررکوردهای مرتبط 
خوشه‌ها | مرکز هر خوشه وین ان دقت 
در هر خوشه در هر خوشه 
۱ ۳۱۳ ۱۳۶ ۳۴ ۳۵ 
۲ ۹:۵۸ ۳۹ ۵ ۱۳/۸۲ 
۳ ۲۰۵۵ ۱ ۱ ۱.۰ 
۴ ۴۵۹ ۹۴ ۵۳ ۵۶2/۳۸ 
کل دقت ۴۸/۵۵ 


جدول ۷ بیانگر میزان دقت در بازیابی عنصر نمونه و براساس توضیحگر مدت زمان هر رکورد 


اسنتتا: میزان دقت برای خوشه اول ۲۵ برای خوشه دوم و /(< خوشه توح ۱۰۰ و خوشه چهارم و( 


جدول ۸. میزان دقت در بازبایی عنصر گسترش 


۲ دها ۵ دهای مر تبط 
شوم فا مر کز هر کل ر کور 9 رکور ی ۶ : ۳۳۹ 
خوشه در هر خوشه در هر خوشه 
۱ الکترونیک ۳۳ ۲۳ 2۹/۶۹ 
۲ سینتی سایزر نذا نز 1 
۳ همنوازی ۱۶ 2۷ 2۷/۷۵ 
۴ تکنوازی ۱۰۸ ۱۰۸ ۱.۰ 
کل دقت ۸۱۱/۸۶ 


سال و شماره ۲ پاییز و زمستان ۱۳۹۵ بررسی میزان دفت در بازیابی منابع شنیداری... ۳۳۵ 


جدول ۸ نشان می‌دهد که میزان دقت برای خوشه اول در حالی که نوع اجرای قطعات الکترونیک 
باشد ۶۹/۶۹ برای خوشه دوم با اجرای سینتی سایزر ۱۰۰ برای خوشه سوم با اجرای همنوازی ۵۷/۷۵ و 


برای خوشه چهارم با اجرای تکنوازی ۰ است. جمع کل میزان دقت برای عنصر گسترش ۸۱/۸۶ است. 


امروزه جایگاه منابع دیداری و شنیداری به‌عنوان یکی از منابع اطلاعاتی مهم به‌عنوان میراث 
فرهنگی برای توسعه کشورهاء ابزاری برای برقراری ارتباطات و دربردارنده ادبیات شفاهی هر ملتی برای 
استفاده کاربران به‌روشنی مشخص شده است. به کارگیری روش‌هایی که عمل بازیابی منابع مزبور را 
سهولت بخشیده و دقت را بالا می‌برد از اهمیت بالابی بر خوردار است. چنانکه اشاره شد حسینی (۱۳۹۰) و 
کرمانی‌حبیب آبادی (۰۱۳۹۰ فیلی و گراکی (۰)۲۰۰۸ لثو و دیگران (۲۰۰۹ تورا و دیگران (۲۰۱۰) و 
شیندلر (۲۰۱۰) از خوشه‌بندی به‌منظور بهبود کیفیت نتایج بازیابی شده در نظام‌های بازیاپی استفاده کردند. 
تیزانتا کسی و ک وک (۲۰۱۲) و سن (۲۰۱۴) میزان دقت منابع شنیداری را با استفاده از روش خوشه‌بندی 
محاسبه کرده و نشان دادند که استفاده از روش خوشه‌بندی می‌تواند میزان دقت در بازیایی منابع شنیداری 
را افزایش دهد. 

نتایج پژوهش حاضر حاکی از آن است که استفاده از روش خوشه‌بندی می‌تواند در افزایش میزان 
دقت در بازیابی منابع شنیداری موثر باشد چرا که رکوردهای موجود در پایگاه را به گونه‌ای تقسیم و دسته- 
بندی می کند که اعضای هر خوشه بیشترین شباهت را به یکدیگر داشته باشند. پژوهش حاضر نشان داد که 
خوشه‌بندی پیشینه‌ها براساس عنوان تأثیر چندانی در افزايش دقت و بازیابی منابع مرتبط تر ندارد و همچنان 
نیاز به انتخاب راهبردی دیگر برای افزایش دقت در بازیابی براساس عنوان است. خوشه‌بندی نتایج براساس 
نام خواننده میزان دقت را تا حد مطلوبی بالا می‌برد که در این پژوهش ۳۹/۴۰ درصد بود. بازیایی 
رکودهای موجود خوشه‌بندی شده در پایگاه اطلاعاتی در صورتی که مدت زمان هر قطعه به‌عنوان پرسش 
جستجو انتخاب شود افزایش می‌یابد. نکته دیگری که می‌توان از نتایج پژوهش حاضر استنتاج کرد آن 
است که با مشخص شدن نزدیکترین و دورترین رکورد تا مرکز خوشه بازه زمانی رکودهای موجود در 
هر خوشه نیز مشخص می‌شود و می‌توان برای یافتن رکوردی با مدت زمان معين و مورد نظر تنها به 
جستجو در یک خوشه اکتفا کرد. خوشه‌بندی رکوردهای موجود براساس نوع اجرای قطعات بیشترین تأثیر 
را بر افزايش میزان دقت دارد تا جایی که در این پژوهش این میزان تا ۸۱/۸۹ درصد افزایش یافت. با 


محاسبه ميانگین میزان دقت در نتایج خوشه‌بندی شده براساس عناصر فراداده پی.بی. کور می‌توان گفت که 


۶ پژوهش‌نامه کتابداری و اطلاع رسانی؛ دانشگاه فردوسی مشهد سال ۶ شماره ۰۲ پاییز و زمستان ۱۳۹۵ 


این روش میزان دفت را تا ۴۳/۱۹ درصد افزايش می‌دهد و خوشه‌بندی می‌تواند روشی مناسب و مفید برای 


ذخیره و بازیابی منابع شنیداری و افزایش میزان دقت باشد. 
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